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ABSTRACT 

The one-parameter psychometric model known as the 
Rasch model is described and examined. The basic principles 
underlying the model and the concepts of unidimensionality, local 
stochastic independence, and additivity are explained in 
non-mathematical terms. The requirements of measurement procedures, 
the measurement of latent traits, the control on model fit, and the 
definition of a trait are discussed. It is argued that the Rasch 
model is particularly appropriate to understand the mutual dependence 
of test reliability and validity. Examples frOTi French native 
language and English foreign language listening comprehension tests 
are used to illustrate the application of the model to a test 
validation procedure. (Author/MSE) 



**************** ******************* ft* ft** **************** ************* 

* Reproductions supplied by EDRS are the best that can be made 

* from the original document. 



00 

o 



TAALTOETSEN 



US OCMRTMENT Of EDUCATION 

Offc* of EducationAl RMMrCh and Improvement 

EDUCATIONAL RESOURCES INFORMATION 
CENTER (ERIC) 

(^Thit document has been reproduced as 
received from the person or Organization 
Originating it 

r Mmor Changes have been made to improve 
reproduction Quality 

e Points of view or opinions stated in thisdocu 
ment do not necessarily represent official 
OERI position or policy 



toegepaste taalwetenschap 
in artikelen 31 

THE RASCH MODEL: UNDERLYING PRINCIPLES AND APPUCATION 
TO TEST VALIDATION 

John H^.L. de Jong 

This paper provides an elementary introduction to the one parameter 
psychometric model known as the Rasch model. It explains the ba'iic 
principles underlying the model and the concepts of ucidimensionality, 
local stochastic bdepcndence, and additi^ty in non-mathematica! 
terms. The requirements of measurement procedures, the measurement 
of latent traits, the control on model flt, and the deHnition of a 
trait are discussed. It is argued that the Rasch model is particularly 
appropriate to understand the mutual dependence of test reliability 
and validity. Examples from foreign language listening comprehension 
tests are used to illustrate the application of the model to a test 
validation procedure. 
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LE MODELE DE RASCH: LES PRINQPES SOUS-JACENTS ET SON 
APPUCATION A LA VAUDATION DF TESTS*) 



John H A.L. de Jong 

Instituut voor Toetsontwikkeling (Cito), Amhem 



Cette communication pr^nte une mtroduction simple au modftle 
psychom6trique connu sous le nom de "module de Rasch". EUe traite 
des rapports entre la fiabilit6, la validity et le niveau de difTicultt 
d'un test et pr6sente une m6thode pour ^valuer la validity. Cette 
m6thode est bas6e sur la comparaison des r6sultats d'6l&ves langue 
£!rang6re et d'6lftves langue matemelle et est illustr6e par des exem* 
pies de tests de comprehension auditive d'anglais et de fran^. 



1. Les qualitis requises d\m procidi de meswt 

Imaginons-nous une personne qui a une s6rie de boules de plomb de 
tallies diff6rentes. II a aussi une s£rie de boites rondes qui ont 6gale- 
ment des tallies difiKrentes. II fait des recherches et d6couvre un rap- 
port tr^ net entre le poids des boules et le nombre de boites dans 
lesquelles elles peuvent £tre mises: moins une boule pise, plus de 
chance elle a de pouvoir £tre mise dans n'importe quelle boite; si les 
boules pftsent plus, il y a moins de boites dans lesquelles elles peuvent 
6tre cas6es. II r6pftte son exp6rience une fois, deux fois, trente-sU 
fois. II constate que son test est fiable et il pourra d6sormais se 
passer de balances pour 6valuer les differences de poids. Mais, une 
nuit, un voleur de plomb s'introduit dans son laboratoire et lui vole 
une partte de ses boules de plomb. Le voleur prend les boules les plus 



*) Deze bijdrage is een aanpassing van een lezing gepuUiceerd in de 
handelingen van het "CoUoque Evaluation dans TEnseignement des 
Langues"i georganiseerd door de Association Nationale des Enseig- 3 
nants de Franfais Langue EUang^re (ANEFLE), 11-12 maart 1988, 
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grosses bien sOr, ocUes-ci rapportant le plus au march6 noir. Pour 
£viter que son mifait soit ddcouvert, le voleur remplace les boules 
vol6es par des boules en plastic soigneusement peintes couleur de 
plomb. Le lendemain matin noCre chercheur revient pour contr61er une 
demiftre fois ses rtsuhats, avant de les publier. H61as, son test ne 
sugg^re plus la mCme relation entre le poids des boules et le nombre 
de boltes dans lesquelfes elles peuvent £tre mises. Ce sont d6sormais 
les boules les plus Idg^res, qui ont le moins de chance de trouver une 
bofte h leur taille. II a beau r6p6ter Teipdrience, il trouve toujours 
ces r6sultats contraires. Son test est done toiqours fiable. II a des 
probl6mes de validit6. Un fait reste pourtant certain: si une boule va 
dans une petite bolte, elle ira aussi dans toutes les boites qui sont 
plus grandes. En r6alit6 son test est un instrument pour mesurer la 
taille d'objets et non pas leur poids, avant la nuit malheureuse aussi 
bien qu'aprfts. 

La morale de cette histoire: Si Ton veut mesurer quelque chose, il 
faut d'abord d6finir Tattribut qu'on va mesurer. Puis, aprfts avoir 
d£velopp6 et mis en oeuvre une mdthode pour mesurer cet attribut de 
maniire fiable, il faut contr6ler la validit6, c'est-i- dire: 6valuer si 
rattribut qu'on a mcsur6 est vraiment Tattribut qu'on voulait mesurer. 



2. Comment prendre la mesure d'un trait latent 

Dans le cas des tests psychologiques et des 6preuves scolaires, nous 
sommes encore plus dans le noir, car il est souvent impossible d'obser- 
ver directement Tattribut que nous envisageons mesurer. II existe 
pourtant une habitude 6tablie depuis longtemps dans le domaine des 
6preuves scolaires, celle qui revient k la simple addition du nombre de 
rdponses correctes - ou bcorrectes, selon le cas - pour baser ensuite 
sur ce nombre un jugement de qualit6. Cest Georg Rasch (1960) qui a 
montr6 qu'en totalisant le nombre de r6ponses correctes pour obten<r 
un mdice de la competence ou de Taptitude d'un candidat, on presup- 
pose en fait que tons les items d'un test mesurent le mfime trait: que 
le test ne mesure qu'une seule dimension. II a prouv6 qu'en effet le 
score total est, comme on dit, une statistique n6cessaire et sufTtsakite 
pour ivaluer une aptitude et il a proposd un modile psychom6trique 
base sur le pr6suppos6 de Tunique dimensbn dans un test. Ce modile 
etablit un rapport probabiliste entre le score total d un candidat et sa 
r6ponse k chacun des items dont le test est compose. 
SunKMOns une collection d'items mesurant le mtme trait et dont on a 
pu etablir Tordre de difficulte. Un candidat a su repondre a un item 
^ di£5culte V, mais il a echoue devant un item de difficulte "x+r. 
ERIC^ deux observations dependent seulemrat de Paptitude du candidat 
H^sala matidre mesure par ces deox items, il est probable qu*il saura 
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Men repondre & un item ayant une difficulte momdre que V mais 
qu'il va sans doute echouer devant chaque item depassant une diffi- 
culte "x + r. En general, il devrait bien repondre i chaque item dans 
rintervalle de V" 4 V et echouer devant chaque item dans Fmter- 
valle de "x+T k •'x+^*. Plus predsement: dans Tintervalle de V 4 
"x+r la probabilite d'une bonne reponse est de 50%; les items approch- 
ant une difficulte de "^x+J une reponse correcte devient de moins en 
moins probable et approche enfin 0%; sa chance s'acCTOit au contraire 
pour les items dans la direction inverse pour aboutir k une probaUlite 
de 100%. 

De la mdme fa^on on devrait pouvoir etablir une relation entre les 
candidats cssayant de repondre k un item. Si de deux candidats I'un a 
bien repondu k un item, et Tautre a une competence plus grande en la 
matiire que I'item pretend mesurer, il est probable que ce dernier 
donnera egalement une reponse correcte. La probabilite d'une reponse 
correcte de la part d'un candidat «plus doue» est plus grande que ccUe 
d'un candidat «moins doue», pour chaque item d'un test, k condition 
que tons les items du test mesurent le mfime trait. 

En comparant items et personnes, on devrait s'attendre k une reponse 
correcte de la part d'une personne qui a une aptitude plus grande que 
Taptitude necessairc k resoudre Titcm, et k une reponse incorrectc de 
la part d'une personne qui a une aptitude moins grande que Taptitude 
necessaire k resoudre Titem. L'aptitude necessaire k resoudre un item 
s'appelle couramment «la difficulte de Titem*. De cette fason, il est 
done possible de situer la clifficulte d'un item et Taptitude d'une per- 
sonne sur le mSme variable. 
Resumons: 

A condition que tous les items d'un test mesurent le mtme trait, 

- le score total d'un candidat constitue un indice suffisant pour 
differencier ce candidat de tout candidat qui n'a pas le m6me score 
total; 

- le nombre total de candidats qui ont repondu correctement a un 
item suffit k etablir la difference entre la difficulte de cet item et 
les items auxquels un nombre different de candidats a su trouver la 
bonne reponse; 

- la probabilite d'une reponse correcte de n'importe quel candidat k 
n'importe quel item depend entiftrement de la difference entre Tap- 
titude du candidat et la difficulte de I'item: si le candidat a une 
aptitude qui est exactement egale k la difficulte de I'item, il y a 
«lutte egale»: une reponse correcte est aussi probable qu'une re- 
ponse incorrecte, chacune des deux issues a une probabilite de 
50%. Dfcs que son aptitude est plus grande que la difficulte de 
litem, une reponse correcte devient plus probable qu'une reponse 
incorrecte; si par contre la difficulte de Titem surpasse son apti- 
tude une reponse incorrecte est plus probable. 
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3. U contrOle des mesumges 

U rebtion cntre la probabilitd d'une r6ponse corrccte d'une part et 
la difference cotre U capacit6 d'une pcrsonne et la difficultd d'un 
item de I'autre est exprim6e math6matiquement dans le mod^e dldgam- 
meat fitnple de Rasch: 



-(x,i-o.i|e,.«i)- ) 



U pr6babilit6 W ^observer unc reponse (x) dc la pcrsonne (v) & un 
item (0 incorrcctc (0) ou corrccte (1), dUuit donndcs la capadt6 {$) dc 
la yenonoc ct la difficult6 (6) de ritem est d6termin6c par la dif* 
fiirence cntre la capacit6 dc la pcrsonne et la difBcu!t6 de ritem. 
Cctte difference est transformfe dans unc ^eur logarithmique n6p6- 
ricn (k base e) pour obtenir unc fonction montante, continue et cou- 
vrant rintcrvallc cntier cntre Ics extremes -•et La fonction de 
oette relation s'appeUe «Courbc caract6ristique d'item» et est illustrte 
dans la Figure 1 d-dcssoui. 



Figure 1 
Courbc caract6ristjque d*item 




Si on accepte ce. ^^^Z^nT^' 'Z^tto^- 
sembldr- sur un tf«t se 'rr^^^ctes tfune personne. 

aprfcs avoir compt6 le nombre de '*P°^ d>«cu» ^ 

on estime sa chance de r6p^dre ^ en rialitd 

dans le test. Puis on peut ^valuer " >«J^^/„odfcie evalue la 
conespondent aux ^^<^^ - ^^^^^^ Se«ent h un certain item 
chance pour une personne de rCpo°a'« ^'T* ^ c^tte personne ft 
ft. disonr90%. une r6ponse mcorrecte de f P^^n ^'uniteUe r6- 

item est "-'^"-"^J-/^;^^^^^ n'a pas travaill6 

ponse est «suspccte». Cest-ft-dire. soh ^ exactement 
Son ses capacitfc. soit I'ltem en <1««^°" "^^^^^^^X^^ de I'adoption 
la meme chose que les autres .trm ^ le .ji ^ff^e 

^Z.:ff: S^JTr t^ucf IS TJs ^»bl J corresponded 
aux predictions du modfcle. 



4. La dipniHon de Vattribut 

de candidats en langue ^^'^t 1 . «. nue c'est que la "ompdtence 

langue L'«e ^^'^"^^P^^SV^ notre h^^^ ce d6veloppe- 
su et ft partir de la naissance. u »p sp6cifiques ft 

■""^ "TfZ^l L-r-rtS^ "P'^"^^ leVloppement cogni- 
une certaine ^"^P"^' Ce d6veloppement cognitif 

tif d'un sujet ft partur de »?J^f*-j^ „ Je plus large: 
comprend ^ t,"T^U'^l%2; Piaget. 1952). des 

racquisition de ^''''^P'lAJ^'tB^^i i^ connaissances linguis- 
comiaissances. et englobe done „o„5,eux 616ments et 

tiques dites g6n6rales, ou ^^^iTes de la faiS^e ^ ''^f^' 
principes ^^^^J^Z^'^^'^JL^^S^^ le modfcle%ropos6 
(Carton, 1971; ;^ud. ,7,'^r^:^rde dimei^ions non-reprisen- 
est une simphfication. II y a °« , dimension sociale. U 

tdes. teUe que la (hmension r6g.onJe^ ou lat cm ^^^^ ^ 
modde ne pr6tend ft auoine ««<J^"f^^°^,^/^, ^isolation du tr«t 
tances indiqudes sur les axes, ce qui imF" 

dit «linguistique». /nersonne apprenant sa langue 

U d6veloppement nonna^ d'un JP^^^ parSit de I'origine et 

matemeUe) est repr6se^6 par ,'»«JS 3X« par centre une persomie 
rSlu:: e?Uetr^^e1urtV^ ^ certain prog., dan. 
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la dimensioii repr6sexitfe par Taxe vertical, mais devra se «rattrapper» 
dans la dunension de I'axe horizontaL Bien silr le d6veloppemeiit cog- 
nidf de cette personne ne s'arr£te pas pendant qu'elle spprend la 
langue 6trang6re. Mais en 6valiiant ses progr&s en laingue 6trang6re9 ce 
dtveloppement a peu d*int6rit. Ce qui compte, c'est de mesurer dans la 
dimension l inguisti q ue: dans la seule direction de I'axe horizontal (cf. 
Chelebourg, 1988). 



Figure 2 

Modftle hypoth6tique d'acquisition de langues 




"Sg% ilngulsfiqua" 



Naturclfement, la langue, «sa parle de quelque chose», et ce quelque 
chose doit etre compris, c'est une condition sine qua non pour com- 
prendre la langue. Cependant, pour efTectuer une 6valuation pure de la 
diff6rence enlre deux candidats en langue 6trangftre, il faut prendre 
soid A ce que la compr6hension ne d6pende pas de diff6rcnces en 
ddvcloppement cognitif. Autrement dit: les diffdrences entre les candi- 
date dont on vcut 6valuer Taptitude en langue 6trangftre ne doivcnt 
pas d6pendre de la compr6hension du signiri6, mais seulement de la 
capacit6 de decoder le signifiant. 

Pour dvaluer si les scores d'un test reflfttent en effet des differences 
rn^A-*'^ <trang4re, on pent comparer les scores de person- 

hKJ^L* connaissant bien la langue avec oeux de personnes qui doivent 
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encore Tapprendre. Pour 6valuer done la validit< tfun test on pent 
v6rifier si des natifa obtiennent un score plus 6Iev6 que des 6lftvcs 
langue 6trangftre. Bien sOr, les deux groupcs doivent avoir atteint 
environ le mime stade de d6vcloppement cognitif pour assurer que les 
diff6rences ddvoUfes par le test d6pendent rdeUement du trait qu'on 
pr6tend mesurer. 



5. Correspondance entre Vattribut i mesun* et le trait mesuri 

Dans la Figure 3 diaque p<rint reprdscnte un item d'un test exp6ri- 
mectal de 59 items d^ compr6hension auditive d'anglais langue 6lran- 
gftre. L'axe de ba*<5 indique les proportions de rfponses correctes don- 
n6cs par des Anglais natifs, comparablcs en fige et en d6veloppement 
aux 61ftves auxqueU le test est destin6. Si 80% de ces natifs r6pondent 
correctement & un item, fitem est jug6 ne pas pr6senter de difficult6s 
pour des natifs. Sur Taxc vertical est indiqu6 Taccord entre les pr6- 
dictions du modftle de Rasch avec les observations obtenues de Tadmi. 
nistration des items i un groupe d'61ftves d'anglais langue 6trangftre. 
Sur cette axe une valeur d6passant 2.21 indique un manque d'accord et 
done une violation de Tassomption d'umdimensionalit6: ces items 
mesurent autre chose que la majorit6 des items. Les valeuis critiques 
des deux axes sont marqutes avec des lignes pointiUdes qui coupent le 
graphique en quatre parties. 



FigmS 

Correspondance entre le trait ii mesurer ti le trait mesur6 
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Dans V. Figure 3 le quadrant en bas k droite comporte le plus grand 
nc»nbre d*ttems (35): la plupart des items mesurent un seuJ trait, qui 
en plus ne pr6sente pas de problftmes pour des natiCs anglais. Dans le 
quadrant en haut k gaudie se trouvent 9 items qui confirment 6gale- 
ment lliypothtoe que le trait mesur6 par le test est r6ellement la 
compr6hen^n de Tanglais: car tout en 6tant trop diffidles pour les 
natifs CCS items ne mesurent pas le m6me trait que la plupart des 
items. Pour 44 (35 f 9) items, soit 75% du nombre total, il y done cor- 
respondimce entre d'une part le contr61e de runidimensionalit6 du test 
efFectu6 par une analyse selon le mod^e de Rasch et d'autre part le 
crit^ ext6rieur op6rationalis6 conune la capacit6 d' Anglais natifs. 
Dans une 6tude ant6rieure (De Jong 1983) nous avons montr6 que par 
un proc6d6 it6ratif d'analyses, en £liminant chaque fois les items qui 
d6passent les deux valeurs critiques, il est possible d'augmenter le 
nombre d'items pour lesquels il y a correspondance entre Tattribut k 
mesurer et le trait mesur6. Dans I'exemple cit6 cette correspondence 
monte k 54 items, soit 92% du nombre total dans le test. 



6. Quelques exemples de mesurages effectuis 

Ci-dessous sont pr6sent6es deux paires d'itemr. pris dans des essais 
de tests de compr6hension auditive: deux items d'\m test de fran^ais et 
deux d'un test d'anglais. Les tests se composaient au total de 42 et de 
59 items respectivement. Ces tests ont 6t6 administr6s k trois groupes 
de personnes: un groupe d'6lftves nderlandais, apprenant le francs ou 
Panglais sc^on le cas. Les deux autres groupes 6taient des natifs: un 
groupe correspondant en fige et en formation au groupe n6erlandais et 
un groupe plus jeune et suivant une formation de niveau moins 6lev6 
que le groupe ndcrlandais. Le premier item de chaque piire est un 
exemple d*un item qui, dans Panalysc selon le module de Rasch des 
rdsultats des ^Itves nterlandais, ne paraissait pis mesurer le m6me 
trait que la majorit6 des items dans le test. Le deuxiftme de chaque 
paire est au contraire un item qui correspond trfts bien au tiait mesur6 
par le test. A part le texte enregistr6 dont on demande la compr6hen- 
uon par les apprenants de la langue ubie, et le texte de question k 
choix multiple destmde k vdriTier cette compr6hension, est indiqu6 
6galement le nombre de personnes de chacun des trois groupes qui a 
choisi chacune des options. 
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Deux items d'un test de compr6hension auditive de fransais: 

14 Texte tfiiregistr6: 

Est-cc qu'il est toujours utile de faire de la publicit6? 
ga, ?a, sa d6pend teUement du type du produit, du type de 
iiiarch6, du, du d6gr6 de concurrence qui pcut exister 
entre, entre les diff6rents produits. Moi, je sais, justement 
i'ai du mal :uh, cssayons de parler, prendre, de prendre 
des exemples concrets. Je ne sais pas moi, j'aime bcaucoup 
le whisky par exemple. Ben, U y a des bons et des mauvais 
whiskies. Mais des bons whiskies U y en a bcaucoup, il y 
en a bcaucoup. Mors au fond euh, ils ont tous pou... pour 
moi, en tant que consommateur, ils ont tous int6r6t i se 
faire connailre... Je crois qu'il y a pcut-<tre une, un, une 
id6e au fond euh, rid6e que de, d'une cspftcc de produit 
id6al qui pourrait se passer de pubiidt6 pour 6tre euh, 
pour etre consonun6 et que "'^ 
traite, sa correspond pas vraiment i une euh, k une 
r6alit6, hein. 



14 Question k choix multiple: R6ponses choisies en % : 



Que dit monsieur X de rutilit6 


qroupc: Nderl. Natl Nat2 


de la publicit6 pour vendre un 


Age: 


175 


16.5 17.5 


produit? 








A Chaque produit proflte de la 


A: 


39 


59 68 


publicit6. 








B Les produits de qualit6 sup6- 


B: 


41 


5 20 


rieure n'ont guftre besom de 








publicit6. 








C Ce sont surtout les produits de 


C: 


20 


36 12 



luxe qui ont besoin de publicitd. 



6Texteenregistr6: 



Vous accepteriez que., un de vos enfants travaiUe comme 
enqufiteur ou eaqu6trice? 

Au porte-a-porte comme sa? Ben. 6coutez, je peux vous 
dire que non seulement j'acccpterais, mais que ma... II est 
arriv6 k ma fillt qui, qui travaUle avec moi, c'est une de 
mes coUaboratriccs... Et ben, c'est pas moi qui I'aie pcrsu- 
adfe de le faire, c'est eUe qui m'a dit qu'clle souhaitait le 
faire, done euh... Et il est arrivd A ma fiUe de le faire et 
elle euh, eUe a pass6 plusieurs mois & faire ce genre de, 
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de, (Teaqufites au porte-l-porte >u bien dans dWres cir- 
coosUnoes* ouL.. hm. EUe a t fia pendant, pendant 
phitieurt mds euh oui, et elfe ^ avait assez» elle en 
i ait mam quoL Et, et moi ce que je lui avais dit, c'6tait 
que ^Aait pu mal qu*eUe fuse oette experience pour se 
rendre oompte euh.^ mais que ftvidemment oe, ca serait 
bien li elle anrivait I faire euh, quelque chose dhin, d*un, 
d'un peu {dus euh, d*un peu plus 6Ubor6e et d'un peu, 
t.^*un peu nueux» quoi. 

6 Question I choix multiple: R6ponses du ' es en % : 



L& iille de monsieur X a travaill6 (troupe: N6erl. Natl Nat2 
conune enqufitrice. Qu'en dit-il? Age: 175 165 17.S 
A n a approuv6 qu'eHe ait voulu A: 48 95 % 

faire ce genre de i^avail. 
B n avait lui-mftme propos6 qu' B: 34 5 4 

elle cssa^^ de faire ce genre de 

travail 

C niuiad'abordd6conseill6de C: 18 0 0 
faire oe genre de travail. 



Litem n* 14 pr6sente des difficultds de compr6hension pour les deux 
grou' le fran^ais qui ont essay6 d'y r6pondre et^ rappelons-nous, 
ritem .4 ^ait aussi Titem qui, d'aprfts Tanalyse de Rasdi, ne mesu- 
rait pas le mtmt trait que la majorit6 des item dans le test. II y done 
une correspondance entre le trait mesur6 et le trait k mesurer. En plas 
rUem n^ 14 suggftre une distance nette entre les deux groupcs de 
. itifs, qui se distinguent par une difference d'tge et de niveau de 
formation. Apparomment Titem mesure sur une dimension relatif k ces 
differences. En analysant le text^ enregistr6 et la question propose on 
se rend fadlement compte oi^ reside la difficulte: il faut suivre exac- 
tement le raisonnement de la personne interviewee avec toutes ses 
hesitations et reprises et non pas prendre trop litteralement ce qu'elle 
dit au iebut du fragment. Ce qu'elle dit 1& sert en fait k gagner du 
temp* *a personne pense k haute voix pour cacher qu'elle ne sait pas 
tout dw suite ce qu'U faut repondre. En plus il faut comprendre que le 
whisky est pris comme exemple de tous les produits et non pas des 
produits de luxe. L'auditeur doit au fond lui-mtme procurer la conclu- 
sion generale k partir d*un exemple concret. Toutes ces operations font 
appel k un certain degre de developpement cognitif qui, paratt-il, n'est 
Q ])at evident parmi les eieves neerlandiais apprenant le franfais, ni parmi 
E RXC^^ francais. 
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pas evident parmi les eieves neerlandais apprenant le fran^ais, ni parmi 
des eieves frangais. 

Bien que Titem n* 6 est egalement assez difficile pour les apprenants 
de fran^ais, il ne presente guere de difficultes aux r;eux groupes de 
natifs. Ijc fait que Pitem n« 6 mesui^ (selon Tanalyse d'aprfts le mo- 
dele de Rasch) la meme dimension que la majorite des items dans le 
test, confirme Thypothese que cette dimension est en effet une aptitu- 
de duns laquelle des natifs excellent, quel que sdent leur ftg^ et leur 
formation. Aussi une analyse de contenu de Titem n* 6 nous montre-t- 
elle que la comprehension du texte enregistre telle qu'elle est verifiee 
dans la question k choix multiple, ne demande qu'une simple operation 
de paraphrase litterale. II s'agit de reconnaJtre «approuver» et «vou- 
loir» dans la question comme synonymes de «accepter» et de «souhai- 
ter» dans le texte enregistre. 

Pour augmenter la validite du test d'essai en tant que test de compre- 
hension du franfais langue etrangere il faudrait, dans la version offi- 
delle, eiiminer des items comme le n* 14 et garder les items comme le 
n* 6. Dans une publication anterieure (De Jong & Glas 1987) nous 
a\'ons montre comment la methode d'analyse iterative en eioignant d'un 
lest les items ne mesurant pas la dimension voulue pent augmenter la 
validite de ce test et de quatre autres tests discutes dans cette publi- 
cation, deux test de fran^ et deux tests d'allemand. 
Void deiu autre items, ccux-d pris d'un test experimental de com- 
prehension auditive de Tanglais. Par hasard le premier item de cette 
paire porte aussi le numero 14. 

14 Texte enrejfitre: 

(On parle de moyens eiectroniques pour payer) 

Is it your impression though that, eh, people are m a way 
reluctant to use these new facilities? 

I thmk one of the problems is, that the credit card is an 
emotive term in some peoples minds. An enormous number 
of people who have Barday cards or Access card, in fact 
use ih^r* for the purchase of goods and there's no credit 
associated with it at all, and that is going to be true of 
the new payment systems. , 
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14 Quesdon I choix multiple: R6poiises choisies en % : 



Som people do not like to buy Groupe: N6erl. Natl Nat2 
things on credit. Age 17.S 16317.5 

A True A: 65 49 69 

B False B- 35 51 31 



44Texteenre9Str6: 

Prince Charles appealed for management and unions to reach a 
better understanding and went on to express his concern that 
Britain wu [-~bua—] its overseas competitors. 



44 Question k choix multiple: R6ponses choisies en % : 

Which word could replace the buzzl Groupe: N6erl. Natl Nat2 
things on aedit. Age 17.5 16.517.5 

A tolerating A: 70 92 % 

B fallingbehind B: 30 8 4 



Dans cette paire dMtems aussi le premier est rejet6 par le modftle de 
Rasch. En accord avec cette observation est le fait que le groupe 
cadet de natifs anglais montre un score mtme plus bas que les appre- 
nants. Cest que id la r6ponse est encore mdns explidte que dans 
Texemple fran^ais. Dans le fragment on demande si certaines person- 
nes n'hdsitent pas k employer Its nouveaux moyens. La r6ponse semble 
ttre positive car il est questbn d'un terme 6motionnel, Ttcouteur 
pouFndt condure que le public n'aime pas rid6e d'acheter k cr6dit. 
Litem demande une gymnastique intellectuelle, qui en soi n'a rien k 
{aire avec la maftrise d'une langue sp6cifique» ct qui explique que les 
deux groupes d*ige ^al ont k peu pr6s la m6me p»obabi]it6 de trouver 
la bciuie r^ponse, queUe que soit leur langue matemelle. Le groupe 
plus jeune a nettement moins de chances. 

Litem n* 44 par contre ne presents aucune difficult^ pour les deux 
groupes de nati6 et les diff6rende Uen du groupe d*apptenants. De ce 
test aussi il faut done 61iminer les items conune le num6ro 14, mais 
garder des items comme le num6ro 44. (Uanalyse de ce test est plus 

y amplement diacutfe dans De Jong 1984a et 1984b.) 

s\}^ Dana introduction de cette communication nous avons expliqu6 com- 
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ment un test fiable pent prdsenter des problftmes de validity. II faud- 
rait en fait pr6ciser: il n'y pas de riabilit6 sans validit6, car si un 
proc6d6 de mesurage se montre fiable il faut qu'il y ait un rappport 
entre les rdsultats du mesurage et quelque attribute manifeste ou 
latent, des objets mesurds. Le problftme est plutdt que souvent on ne 
sait pas quel attribut on a mesur6, c'est-ft dire: k quoi Ic test est 
valide. Inversement il n"y a pas non plus de validit6 sans fiabilitd, car 
comment pourrait-on pr6tendre qu'on a vraiment mesur6 un otqet, si k 
chaque nouvelle prise de mesure, la mesure change? Le grand avantage 
du modde de Rasch est justement que les pr6suppos6s du modftle 
partent de cette indivisibility et forcent le constructeur de test k ct 
rendre compte que la difficult^ d'un item, d'un test doit s'expliquer en 
termes de I'attribut que I'on veut mesurer. Cette communication a 
montr6, je Tespire, comment on pent d^voiler le caractire du trait 
latent en se servant du modde de Rasch pour 6tablir un rapport entre 
la dimension dans laquelle le test mesure et I'attribut que Ton envisa- 
ge de mesuiCr. 
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